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摘要 随 着 天 文 探测 技术 的 快速 发 展 , 海量 的 星系 图 像 数据 不 断 产生 , 能 够 及 时 高 效 地 对 星系 图 像 进行 形态 
类 对 研究 星系 的 形成 与 演化 至 关 重 要 . 针对 传统 的 星系 形态 分 类 模型 特征 选择 困难 、 分 类 速度 慢 、 准 确 率 受 
等 难题 , 提出 一 种 以 Inception-v3 神 经 网 络 为 主干 结构 , 融合 压缩 激励 (Squeeze and Excitation Network, SE 
道 注意 力 机 制 的 星系 形态 分 类 模型 . 该 模型 在 斯 隆 数 字 巡 天 (Sloan Digital Sky Survey, SDSS) 样 本 的 测试 集 ; 
确 率 高 达 99.37%. 旋涡 星系 、 圆 形 星系 、 中 间 星 系 、 雪 茄 状 星系 与 侧 向 星系 的 F1 值 分 别 为 99.33%、99.58%、 
99.3396. 99.41% 599.16%. 该 模型 与 Inception-v3、MobileNet (Mobile Neural Network) 和 ResNet (Residual 
Neural Network) 网 络 模型 相 比 , SE-Inception-v3 宽 度 和 深度 优势 表现 出 更 强 的 特征 提取 能 力 , 可 以 高 效 识 别 不 
同形 态 的 星系 , 为 未 来 大 型 巡天 计划 的 大 规模 星系 形态 分 类 问题 提供 了 一 种 新 方法 . 
关键 词 星系 : 普通 , 方法 : 数据 分 析 , 技术 : 图 像 处 理 
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1 引言 Telescope Medium Deep Survey)!!*!, GOODS (The 
16] 


星系 作为 字 宙 的 重要 结构 之 一 , 是 系 外 行星 的 Great Observatories Origins Deep Survey)! 
主要 聚集 地 . 研究 星系 对 理解 字 宙 的 形成 和 演化 及 HUDF (Hubble Ultra Deep Field)!" !59,, COS- 
行星 的 生命 历程 有 着 重要 的 意义 . 星系 形态 是 表征 MOS (Cosmic Evolution Survey)! 971. CAN- 
星系 结构 最 直接 的 观测 特征 上 3, 研究 星系 形态 分 DELS (Cosmic Assembly Near-IR Deep Extra- 
类 对 于 解答 星系 形态 在 宇宙 不 同时 刻 的 演化 过 程 Salactic Legacy Survey)””、 斯 隆 数字 巡天 
ZEEN 在 众多 星系 分 类 系统 中 65-10, 目前 最 (Sloan Digital Sky Survey, SDSS)P? 9 等 , 海量 的 
常用 的 星系 形态 分 类 系统 为 哈 勃 分 类 系统 0 , ng 星系 图 像 与 数据 不 断 涌 入 人 们 的 视野 , 因此 能 够 
分 类 系统 最 早 于 1922 年 提出 , 发 展 至 今 逐 步 被 补充 及 时 高 效 地 对 星系 图 像 进行 形态 分 类 变 得 十 分 
而 日 趋 完善 82- 艾 , 是 星系 形态 分 类 的 重要 参考 依 关键 . 一 些 从 数学 视角 出 发 的 星系 形态 分 类 方法 
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Ja. 应 运 而 生 , Lorenzo 等 2 采用 分 数 三 角形 算法 按照 
随 着 天 文 观测 技术 与 天 文 仪器 的 不 断 发 展 , 大 星系 悬臂 轨迹 对 椭圆 星系 与 环 状 星 系 进行 形态 


> 


规模 的 巡天 项 目 逐 步 实 施 , 如 MDS (Hubble Space 
2022-11-22 收 到 原稿 , 2023-01-09 收 到 修改 稿 
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类 ; Selim 等 2 采用 非 负 和 矩阵 分 解 算法 识别 星系 
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形态 ; Hosny 等 29] 采 用 四 元 极 性 复 指 数 变化 与 二 
元 随机 分 形 搜索 算法 对 星系 形态 进行 分 类 . 在 人 
工 智能 与 机 器 学 习 技术 快速 发 展 的 大 背景 下 , 越 
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象 处 理 , 经 过 不 同 网 络 层 的 特征 学 习 进 而 得 到 高 维 
星系 形态 特征 , 较 好 地 解决 了 星系 形态 分 类 研究 中 
准确 率 低 的 问题 , 为 未 来 从 海量 的 星系 图 像 中 对 不 
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来 越 多 的 人 工 智 能 技术 被 广泛 应 用 到 系 外 行星 
搜寻 、 光 谱 分 类 、 星 系 形态 分 类 等 领域 B0 -34, 机 
器 学 习 可 以 帮助 天 文 工 作 者 从 不 同 维度 提取 特征 
言 息 并 探索 隐 含 层 与 高 维 复杂 数据 间 的 关联 , 减 
少 研究 人 员 利 用 其 领域 知识 进行 人 工 特征 设计 
的 工作 量 . Huertas-Company 等 B5 Ej Freeq 5/56] $1 
采用 支持 向 量 机 (Support Vector Machine) 的 
方法 对 来 自 SDSS 的 星系 图 片 进行 形态 分 类 ， 
Huertas-Company 等 B5 给 出 了 各 类 星系 形态 的 
概率 估 计 ，Freed 等 B9 对 椭圆 星系 与 旋涡 星系 
进行 了 二 分 类 ，Almeida 等 8 采用 kk 均值 聚 类 算 
法 (k-means clustering algorithm) 对 SDSS 星 系 光 
谱 进 行 分 类 . 除 此 之 外 , 大 量 基 于 卷 积 神经 网 
络 (Convolutional Neural Network, CNN) 的 分 类 算 
法 应 用 于 星系 形态 分 类 , 如 旋转 不 变 (Rotation- 
invariant)t$ $195, ResNet (Residual Neural Net- 
work) 卷 积 B9j、 随 机 森林 (Random forest), 
样本 学 习 (Few-short learning)!!, %4 El 4g f 5 
集成 学 习 (Convolutional autoencoder and bagging- 
based multiclustering model)!?! #lEfficientNet 4 
2143], 

这 些 星系 形态 分 类 方法 与 不 断 增加 的 海量 天 
文 观测 数据 极 大 推动 了 星系 形态 分 类 领域 的 发 展 . 
然而 这 些 分 类 方法 也 存在 不 同 星系 形态 样本 数量 
失衡 、 特 征 选 择 困难 等 问题 , 合理 搭建 星系 形态 网 
络 模型 以 优化 分 类 速度 与 分 类 准确 率 就 显得 至 关 
重要 , Inception-v3 神 经 网 络 在 解决 图 像 分 类 任务 
方面 有 两 个 优点 : (1) 采 用 分 解 卷 积 增加 卷 积 网 络 
深度 与 宽度 , 在 增加 了 网 络 非 线性 表达 能 力 的 同时 
还 加 快 了 训练 速度 ; (2) 稀 跑 结构 可 以 减轻 计算 量 
并 减少 过 拟 合 . 压缩 激励 (Squeeze and Excitation 
Network, SE)[( 针 通道 注意 力 机 制 通过 自学 习 的 方 
式 , 获取 特征 图 每 个 通道 的 重要 程度 , 抑制 对 星系 
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同 星系 进行 精准 分 类 提供 快速 高 效 的 分 类 模型 参 
考 . 


2 网络 模型 
2.1 ”Inception-v3 主 干 网络 

Inception-v3 模 型 是 由 Google 开 发 的 以 Incep- 
tion 网 络 结构 构成 的 第 3 代 CNN 分 类 器 ，Incep- 
tion 模 块 的 主要 思想 是 用 密集 成 分 来 近似 最 优 的 局 
TiS PA AG RA, 在 传统 卷 积 神经 网 络 模型 中 引入 了 分 
解 卷 积 , 示意 图 如 图 1 所 示 . 分 解 卷 积 的 主要 目的 是 
减少 网 络 中 的 参数 量 , 主要 方法 有 对 称 式 分 解 和 非 
对 称 式 分 解 卷 积 . 对 称 式 分 解 卷 积 如 图 1 (a) 所 示 , 5 
x 5 卷 积 使 用 两 个 3 x 3 的 卷 积 代替 , 可 以 减少 28% 
的 参数 量 与 计算 量 , 同时 分 解 后 增加 了 一 个 激活 函 
数 进而 增加 了 非 线 性 表达 能 力 , 使 得 网 络 局 部 特征 
更 加 明显 , 加 快 了 网 络 训练 速度 . 非 对 称 式 分 解 卷 
积 如 图 1 (b) 所 示 , 3 x 3 的 卷 积 采用 1 x 3 与 3 x 1 的 
卷 积 来 代替 , 可 以 减少 33% 的 参数 量 与 计算 量 , 这 
种 非 对 称 的 卷 积 结构 拆 分 能 够 处 理 更 丰富 的 空间 
特征 . Inception-v3 网 络 结构 如 图 2 所 示 ， 从 输入 端 
开始 先后 是 3 个 卷 积 层 、1 个 最 大 池 化 层 、2 个 卷 积 
层 、1 个 最 大 池 化 层 、11 个 混合 模块 、 全 局 平均 池 
化 层 、Dropout 层 、 全 连接 层 与 Softmax 层 . 


形态 用 处 不 大 的 特征 通道 , 让 神经 网 络 关注 权重 高 
的 特征 通道 . 因此 本 文 提出 了 一 种 以 Inception-v3 
神经 网 络 为 主干 结构 , 融合 SE 通道 注意 力 机 制 的 
星系 形态 分 类 模型 . 该 模型 平衡 了 网 络 的 宽度 与 深 
FE, 避免 特征 描述 瓶颈 , 通过 将 低层 次 特征 进行 抽 


区 


X1 分 解 卷 积 示意 


，(a) 为 对 称 式 分 解 卷 积 ;(b) 为 非 对 称 式 分 解 卷 


积 . 


Fig.1 Structure of decomposition convolution, (a) the 
symmetric decomposition convolution; (b) the asymmetric 


decomposition convolution. 
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[—7 Convolution 


Mmm Fully Connected 


ENEN MaxPool DOM, 
MEE AvgPool — E Fd 
EE Concat m 
图 2 Inception-v3 网 络 结构 图 
Fig.2 Structure of Inception-v3 neural network 
2.2 ”SE 通道 注意 力 机制 融合 , 它 能 在 不 改变 特征 图 大 小 的 情况 下 对 输入 


SE 是 一 种 即 插 即 用 的 通道 注意 力 模块 , 通过 特征 m: 行 通 道 特征 加 强 , 其 网 络 结构 如 图 3 所 示 ， 
压缩 (Squeeze)、 激 励 (Excitation) 与 Scale 相 乘 特 征 SE 通道 注意 力 机 制 主要 包括 以 下 4 个 步骤 : 


图 3 SEM ZK 


Fig.3 Structure of squeeze and excitation (SE) network 


(1) Transformation (Fe): 给 定 一 个 输入 特征 
EIX, AERERH'xW'xC', KP HERI (Height), Z= FaU) = guy SLU), ) (9 
W' 是 宽度 (Width)， C' 是 通道 数 (Channel). X 通过 式 中 a 与 9 分 别 表示 特征 图 横 纵 坐标 点 的 值 . 
TERAELT WURCSU. 特征 图 U 维 度 为 H x W x C, (3) Excitation (Fox): 将 Squeeze 操 作 得 到 的 ZZ 


其 中 太 、W 与 C 分 别 对 应 其 高 度 、 宽 度 与 通道 数 。 输入 至 2 个 全 连接 层 W 生 成 我 们 想 要 的 通道 权重 5， 
(2) Squeeze (Fesq): Squeeze RIE x 两 层 全 连接 层 之 间 存 在 一 个 超 参数 及 ,向量 Z 经 过 


W x C 通 过 全 局 池 化 压缩 为 特征 向 量 2Z, 即 1 x 1 meanings 由 1 x 1 x C 变 为 1 x 1 
x C, 相当 于 把 Hx W 压 缩 成 一 维 , 该 一 维 参数 获 x O/R, 再 经 过 第 2 层 全 连接 层 Wz, 维度 由 1 x 1 
TH x W 全 局 视野 . 如 (1) 式 所 示 : x 0/R 变 为 1 x 1 x C. 经 过 两 层 全 连接 层 后 得 到 
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的 S 中 不 同 数值 表示 不 同 通道 的 权重 信息 . 如 (2) 式 
所 示 : 


S = Fal. W) = o(W26(W,Z)) ) (2) 


其 中 5 代表 第 1 层 全 连接 层 T 的 激活 函数 ReLU， 
( 
ReLU — f(z) — max(0,2), f'(z) — n M 
0, «<0, 
(3) 
其 中 , z 与 /分 别 表 示 横 纵 坐 标的 取 值 , o 代 表 第 2 层 
全 连接 层 W 的 激活 函数 Sigmoid,， 

Sigmoid = f(x) = ] I (4) 


(4) Scale (Fu): 将 Excitation 操 作 生成 的 权 
重 向 量 S 加 权 到 原始 输入 特征 图 UU 的 每 个 通道 上 ， 
即 特征 图 U 中 每 个 通道 的 万 x WW 个 数值 都 乘 S 中 
对 应 通道 的 权 值 , 便 得 到 我 们 想 要 的 特征 图 XX', 其 
尺寸 大 小 与 特征 图 U 完 全 一 样 , SE 模块 不 改变 特征 
图 的 大 小 . 如 (5) 式 所 示 ， 


X = Freste(U,S) = SX U. (5) 


2.3 SE-Inception-v3£àf4 

本 研究 提出 的 SE-Inception-v3 星 系 形 态 分 类 
模型 是 基于 迁移 学 习 对 模型 参数 进行 微调 ， 
ception-v3 网 络 结构 为 基础 , 添加 SE 通道 注意 
制 , 使 模型 选择 性 地 关注 星系 图 像 重 点 
模型 框架 如 图 4 所 示 . 

迁移 学 习 是 指 将 一 个 在 某 领 域 完 成 学 习 任务 
的 神经 网 络 应 用 到 新 的 领域 进行 学 习 训 练 . 通常 已 
训练 完毕 神经 网 络 模型 的 前 几 层 学 习 到 的 是 通用 
特征 , 随 着 网 络 层 数 的 增加 , 更 深层 的 网 络 更 加 偏 
重 于 学 习 特定 的 特征 , 因此 可 将 通用 特征 迁移 到 其 
他 相关 领域 . 对 于 深度 卷 积 神经 网 络 来 说 , 经 过 预 
训练 的 网 络 模 型 可 以 实现 网 络 结构 与 参数 信息 的 
分 离 , 在 保证 网 络 结构 一 致 的 前 提 下 , 便 可 以 采用 
预 训练 得 到 的 权重 参数 来 初始 化 新 的 神经 网 络 , 这 
参数 迁移 的 方式 极 大 缩短 了 神经 网 络 训练 时 间 . 


X 学 dk 2 
如 图 4 中 的 上 图 所 示 , 在 获取 基于 ImageNet 数 据 集 
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预 训 练 完毕 的 Inception-v3 模 型 后 , 用 新 网 络 模型 
的 全 连接 层 蔡 换 基于 ImageNet 数 据 集 网 络 模型 的 
全 连接 层 , 采用 ImageNet 预 训练 得 到 的 权重 参数 来 
初始 化 新 模型 , 在 星系 数据 集 上 训练 剩余 参数 , 直 
至 新 网 络 模型 训练 完毕 . 基于 ImageNet 数 据 集训 练 
完毕 的 神经 网 络 模型 泛 化 能 力 强 , 通过 迁移 学 习 扩 
充 了 星系 训练 数据 , 使 得 新 网 络 模型 具有 更 高 的 训 
练 精度 与 更 强 的 鲁 棒 性 . 

如 图 4 中 的 下 图 所 示 , SE-Inception-v3 星 系 形 
态 分 类 模型 主要 分 为 Blockl、Block2、Block3 与 
SE 共 4 个 模 组 : 

(1) Block1 为 Inception 对 称 式 分 解 卷 积 结构 ， 
其 4 个 分 支 上 均 有 1 x 1 卷 积 核 , 相 邻 感受 野 的 卷 积 
是 高 度 相 关 的 , 使 用 1 x 1 的 卷 积 有 利于 保留 相 邻 
单元 之 间 的 相关 性 , 在 降低 约 28% 模 型 参数 量 的 同 
时 又 能 增加 模型 的 特征 表达 能 力 ; 
(2) Block2 为 Inception 对 称 式 分 解 卷 积 的 拓展 
结构 , 可 用 1 x n 卷 积 拼 接 nx 18 fn x n 以 减少 
网 络 参 数量 与 计算 量 , 卷 积 核 " 常 选用 3、5、7 等 常 
数 , 该 模块 适用 于 网 络 中 层 用 以 提取 星系 形态 特征 
EE, 特征 越 多 收敛 越 快 , 输入 的 星系 形态 信息 就 
会 被 分 解 得 越 彻 底 ; 

(3) Block3 为 Inception 非 对 称 式 分 解 卷 积 结构 ， 
该 模块 适用 于 网 络 后 期 以 扩充 通道 数 提取 星系 高 
AEF EAE AE, Block3 模 块 可 降低 约 33% 的 网 络 参 数 
分 解 卷 积 在 增加 卷 积 神经 网 络 的 深度 和 宽度 的 
司 时 , 又 减少 了 参数 量 和 计算 量 , 避免 模型 陷入 过 
拟 合 , 使 得 Inception-v3 神 经 网 络 不 仅 具 有 密集 矩 
阵 的 高 计算 性 能 , 又 保持 了 滤波 器 级 别 的 稀 疏 性 . 
此 外 , 多 个 卷 积 核 共同 作用 相当 于 为 模型 增加 了 多 
个 激活 函数 , 大 大 提升 了 模型 的 非 线性 表征 能 力 ; 

(4) SE 实现 通道 注意 力 机 制 最 重要 的 两 个 地 
方 分 别 是 全 连接 层 与 相 乘 特征 融合 , 假设 输入 图 像 
维度 为 太 x W x C, 通过 全 局 池 化 (Global Pool- 
ing) 与 全 连接 层 (Fully Connected) 拉 伸 为 1]x1xC， 
然后 再 和 原 图 像 相 乘 , 给 每 个 通道 赋予 权重 , 可 以 
更 好 地 拟 合 通 道 间 复 杂 的 相关 性 , 在 提高 网 络 运 行 
时 间 的 同时 又 减少 了 参数 计算 量 . 
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Convolution Pooling 


SE-Inception-v3 model 


Input 


m conv2d(ReLU, BN) , conv2d(ReLU, BN) . 
[size, 299, 299, 3] 


3x3, 32, stride=2 3x3, 32, stride=1 


.. conv2d(ReLU, BN) MaxPool conv2d(ReLU, BN) 
1x1, 80, stride=1 3x3, stride-2 3x3, 64, stride=1 
conv2d(ReLU, BN), MaxPool Block 1, module 1 
3x3, 192, stride=1 3x3, stride=2 [size, 35, 35, 256] 


Block 2, module 1 
[size, 17, 17, 768] 


Block 1, module 3 L| Block 1, module 2 
[size, 35, 35, 288] [size, 35, 35, 288] 


-© 


Block 2, module 2 Em 
[size, 17, 17, 768] 


Block 2, module 4 
[size, 17, 17, 768] 


Block 2, module 3 in 
[size, 17, 17, 768] 
Block 3, module 1 
[size, 8, 8, 1280] -@- 
SES AvgPool ; 
8x8, stride=1 , 


Block 3, module 2 
[size, 8, 8, 2048] 


Block 2, module 5 
[size, 17, 17, 768] 


Block 3, module 3 
[size, 8, 8, 2048] 


conv2d(3x3) 


agum 


Inception 


Fully Connected 
Y 


Base M 
,  Blockl Block2 à 
d Base ` 
" AvgPool conv2d(1x1)  conv2d(1x1)  conv2d(1x1) ， 
i Y Y Y 
H conv2d(1x1) AvgPool  conv2d(1x1) conv2d(1x1) conv2d(1x1) conv2d(1xn) conv2d(1xn) 
! Y 
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i conv2d(1xn) 
: conv2d(3x3) 
i conv2d(nx1) 
; Concat y ! 
: Concat 
| — Block Xi 
' Base Inception 一 一 人 
i Global Pooling 
， conv2d(1x1) conv2d(1x1) AvgPool conv2d(1x1) x Y 


conv2d(1x3) conv2d(3x1) 
| | 


conv2d(1x1) conv2d(1x3) conv2d(3x1) x | Fully Connected 
Y 
Y Sigmoid 
Scale *— — — 


(b) 


Concat (a) Inception-v3 


图 4 ”SE-Inception-v3 星 系 形 态 分 类 模型 


SE-Inception-v3 


Fig.4 Galaxy morphology classification model based on SE-Inception-v3 
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如 图 4 中 的 中 图 所 示 , SE-Inception-v3 星 系 形 
态 分 类 模型 流程 为 输入 维度 为 299*299*3 的 天 文 图 
像 数 据 , 其 后 进入 一 个 有 32 个 3 x 3 卷 积 核 、 步 长 
(stride) 为 2 的 卷 积 层 (conv2d), 经 过 ReLU dii K 
数 与 批 归 一 化 (Batch Normalization，BN) 处 理 后 
依次 通过 2 个 卷 积 层 、1 个 最 大 池 化 层 、2 个 卷 积 
层 、1 个 最 大 池 化 层 、14 个 混合 模块 后 进入 一 个 大 
小 为 8 x 8、 步 长 为 1 的 平均 池 化 层 (AvgPool), 其 
后 先进 入 Dropout 层 丢弃 部 分 隐 含 层 神经 元 , 使 网 
络 变 得 更 为 紧凑 以 避免 过 拟 合 , 然后 依次 进入 全 
连接 层 与 Softmax 层 , 最 后 输出 星系 形态 分 类 结果 . 
其 中 ，SE-Inception-v3 模 型 在 每 个 卷 积 层 后 加 入 
的 ReLU 激 活 函数 可 以 增加 模型 的 非 线性 , 加 入 的 
批 归 一 化 可 以 减 小 网 络 内 部 协 方差 . SE-Inception- 
v3 星系 形态 分 类 模型 在 网 络 前 端 避 免 了 从 输入 到 
输出 特征 维度 的 严重 压缩 . 分 解 卷 积 将 高 维度 信息 
在 网 络 局 部 进行 处 理 , 进而 加 快 网 络 训练 速度 . 空 
间 聚 合 通 过 低 维 岁入 , 在 不 降低 网 络 表示 能 力 的 同 
时 又 加 快 学 习 速 度 . SE-Inception-v3 模 型 4 个 模 组 
的 合理 搭配 较 好 地 平衡 网 络 每 层 滤波 器 的 个 数 和 
网 络 层 数 , 并 行 增加 网 络 宽度 与 深度 使 得 网 络 性 能 
最 大 化 . 
3 数据 准备 
大 型 巡天 项 目 斯 隆 数字 巡天 (SDSS)! 被 认为 
是 诸多 巡天 项 目 中 颇具 影响 力 的 一 个 , 6 EI 
约 1/3 的 天 区 , 其 中 包括 北 天 球 的 一 半 和 少 部 分 南 
天 球 天 区 . SDSS 的 CCD (Charge-Coupled Device) 
测 光 系统 利用 6 组 CCD 同 时 对 天 体 的 5 个 波段 (u、 
gy ty i 引进 行 测 光 , 获得 了 5 亿 多 个 天 体 的 精确 
测 光 数据 , 并 对 其 中 的 300 多 万 个 恒星 与 星系 进行 
了 确认 , 这 些 星系 的 能 谱 特 征 主要 集中 在 g、r、i 这 
3 个 波段 , SDSS 网 站 上 提供 这 3 个 波段 合成 的 伪 彩 
色 图 片 , 为 用 户 研究 各 类 星系 形态 分 类 模型 提供 了 
有 力 的 数据 支持 . 
本 文采 用 的 星系 数据 集 来 源 于 Kaggle? 平 台 的 
Galaxy Zoo2, Galaxy Zo002 数 据 集 采集 自 SDSS 


lhttps://www.sdss.org 
2https://www.kaggle.com 
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DR7 (Data Release 7) 的 RGB (Red Green Blue) 彩 
ERF, 用 户 可 直接 通过 SQL (Structured Query 
Language) 语 句 从 SDSS 的 Skyserver 平 台 获 取 星 系 
图 像 数 据 . Galaxy Zoo2 经 过 志愿 者 投票 对 星系 图 
片 给 定 类 别 标签 值 . 哈 勃 星系 形态 分 类 系统 采用 目 
视 方法 将 星系 分 为 旋涡 (Spiral) 星 系 、 圆 形 (Comple- 
tely round smooth) Æ A, 中间 (In-between smooth) 
星系 、 雪 茄 状 (Cigar-shaped smooth) # #5 {ill [al 
(Edge-on) 星 系 等 . ACH FH 580 E. ABI AS 2) RJ 
WU) f HR Willett Aie 49 $e GE EK) Ed. R JE AS oy 2S 2H D] MA 
Galaxy Zoo2 中 挑选 星系 样本 . 星系 选择 标准 如 表 1 
Prax, 其 中 TO1-T11 表 示 的 是 Galaxy Zoo2 中 的 11 
个 星系 形态 分 类 任务 的 类 型 ，ftesturesjqisk 代 表 一 
张 星系 图 片 被 分 类 为 平滑 且 有 盘 状 结构 的 概率 ; 
fcage_onnmo 代 表 一 张 星系 图 片 被 分 类 为 非 侧 向 星系 
的 概率 ; fspiralyes 代 表 一 张 星 系 图 片 被 分 类 为 旋涡 
星系 的 概率 ; fwootn 代 表 一 张 星系 图 片 被 分 类 为 平 
滑 星系 的 概率 ; fcompietelyround 代 表 图 片 被 分 类 为 圆 
形 星系 的 概率 ; fbetween 代 表 一 张 星 系 图 片 被 分 
类 为 处 于 圆 和 雪茄 状 之 间 的 概率 ; /isa shaped 代 表 
图 片 被 分 类 为 雪茄 状 的 平滑 星系 的 概率 ; Nsampie 代 
表 数 据 集 选取 的 样本 数 . 

本 文 从 Galaxy Zoo2 中 分 别 挑选 3400 颗 不 同 星 
系 形态 的 图 片 作为 星系 形态 分 类 模型 的 数据 输 


AS 


入 , 其 中 部 分 星系 形态 图 片 如 图 5 所 示 , 将 样本 集 按 
照 11:3:3 的 标准 随机 分 为 训练 集 、 验 证 集 与 测试 集 ， 


如 表 2 所 示 , 其 中 每 类 星系 样本 中 训练 集 为 2200 张 
星系 图 片 , 验证 集 与 测试 集 分 别 为 600 张 . 


4 实验 设置 
4.1 ”实验 平台 
(1) 操 作 系 统 : Windows 10; 
图 形 人 处理 器: NVIDIA GeForce GTX 


950 M; 
(3) 深 度 学 习 框 架 : TensorFlow 1.12; 
(4) 编 程 语言 : Python 3.6.5. 
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表 1 星系 数据 选择 标准 


Table 1 Galaxy data selection criteria 


Class Class-name Tasks Thresholds Nsample 
TOL ffeatures/disk > 0.43 
1 Spiral T02 fedge—on,no Z 0.715 3400 
'T04 J'spisal;yes 2 0.619 
TO1 femooth > 0.469 
2 Completely round smooth 3400 
工 07 feompletelyround 2 0.5 
TO1 femooth > 0.469 
3 In-between smooth 3400 
TO7 Jinzbebween 之 0.5 
TO1 femooth > 0.469 
4 Cigar-shaped smooth 3400 
工 07 feigar—shaped 2 0.5 
TOL ffeatures/disk > 0.43 
5 Edge-on 3400 
T02 fedge—on,yes Z 0.602 
#2 星系 数据 集 构成 
Table 2 The composition of galaxy dataset 
Dataset Training Validation ‘Testing Total 
Spiral 2200 600 600 3400 
Completely round smooth 2200 600 600 3400 
In-between smooth 2200 600 600 3400 
Cigar-shaped smooth 2200 600 600 3400 
Edge-on 2200 600 600 3400 
Total 11000 3000 3000 17000 
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4.2 ”实验 步骤 


Galaxy Zoo2 原 始 图 


E ERR SEEK UL BET £e ETT iR P 


配置 越 高 , 选用 的 图 


征 信 息 . 在 权衡 整体 样本 
裁剪 为 299*299, 既 最 大 化 保留 主体 


的 同时 又 控制 了 计 委 


PER 


里 


算 Softmax 


天 文 学 R 2 期 
图 5 采集 自 SDSS 的 星系 形态 图 像样 本 
Fig.5 Galaxy images from SDSS dataset 
数 权重 , 最 后 用 测试 集 对 已 训练 好 的 星系 形态 分 类 


像 尺 寸 为 424*424, eA 


HAY 


处 理 


ABE 
AS 


Ed 
FE 


行 训 练 , 通 


时 要 求 的 
像 尺 寸 过 小 又 会 丢失 部 分 特 
后 , 本 文 将 原始 图 像 
系 形态 特征 
量 . 训练 过 程 中 , 每 批 次 训练 
(batch size) 为 16 张 , 学 习 率 (learning rate) 为 0.01， 
训练 周期 (epochs) 为 145 次 . 
逐步 进入 SE-Inception-v3 模 型 进 
屋 的 输出 与 给 定 星系 形态 类 别 标签 值 二 


星系 训练 集 图 像 分 批 次 
过 计 


者 的 误差 , KAHU P AE SUE ER (cross entropy 


loss) 调 整 权 重 参数 ， 


H(y,y) = — > v(z)le(y), 


其 中 y 为 标 
AE XAZI 
AE XS. 


zu 


有 率 时 训练 过 程 结 


画 的 是 两 个 概率 分 布 的 
越 小 , 两 个 概率 分 布 越 接近 . 训练 每 
达 100 批 次 时 , 验证 集 即 对 已 训练 好 的 模型 进行 
类 准确 率 验证 , 直到 逐步 调整 权重 参数 达到 预期 准 


R, 保存 星系 形态 分 类 模型 的 参 


(6) 


签 值 , y 为 预测 值 , HAX MIR RE. 


三 | 
生 


HE, 也 就 是 说 


ii 


SPAN 


TJ 


异型 进行 准确 率 验 证 , 输出 星系 分 类 结果 . 
4.3 ”评价 指标 
本 文选 用 训练 准确 率 (Training Accuracy)、 验 


证 准确 率 (Validation Accuracy)、 训练 损 失 (Train- 
ing Loss)、 验证 损失 (Validation Loss) 来 评估 基于 
SE-Inception-v3 的 星系 形态 分 类 模型 的 训练 集 与 
验证 集 性 能 ; 选用 混淆 矩阵 (Confusion Matrix). 

准确 率 (Accuracy)、 精确 率 (Precision)、 召回 率 (Re- 
call)、F1 值 (Fl score) 来 评估 星系 形态 分 类 模型 的 
测试 集 性 能 . 训练 准确 率 如 (7) 式 代表 了 星系 形态 
分 类 模型 的 训练 集 的 准确 度 , Hp X actual- te C e 
训练 集 实际 为 真 的 情况 ， XPsoet ee 代表 训练 集中 
预测 值 是 真 的 情况 . 


i 


a 


ANS 


X Predict—true 
TrainingAccuracy — m . (7) 
验证 准确 率 如 (8) 式 代表 了 星系 形态 分 类 模型 
的 验证 集 的 准确 度 ， 其 中 Xactual=true He Fe Tks pf n 
实际 为 真 的 情况 , x Dott te Ree up Se rn TRU E 
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是 真 的 情况 . 对 负 样 本 的 区 分 能 力 , 精确 率 越 高 , 模型 对 负 样 本 
y^ ypredict=true 的 区 分 能 力 就 越 强 , 计算 公式 为 : 
ValidationAccuracy = Se . (8) 
ae TP 
MARORI T VIL AIS XC Precision = Tp pp ` (12) 
值 , 它 表示 的 是 模型 实际 输出 和 期 望 输出 的 偏差 ， 
差 值 越 小 期 望 输出 的 准确 率 越 高 . 随 着 星系 分 类 模 召 dis dO a 为 正 的 样 
型 的 收敛 , 训练 损失 会 逐步 向 0 趋 近 , 其 中 ， ts 空 际 为 正 的 样本 的 比 率直 观 地 说 是 
表 训练 集 真实 的 第 i 个 星系 图 像 是 ;类 的 概率 ， 本 所 占 实际 为 正 的 样本 的 比例 , 召回 率直 观 地 说 是 
放 集 真实 的 第 个 星系 图 像 是 类 的 概 六 2%。 分 类 器 找到 所 有 正 样本 的 能 力 ABLE, BUY 
代表 训练 集 第 ;个 星系 图 像 被 预测 为 7 类 的 概率 . pie TU, ae MD) í 
对 正 样本 的 识别 能 力 就 越 强 , 表达 式 为 : 
TrainingLoss = 2530 30-08. gp). (9) 
、 TP 
Fer Uk tha AR (10) RRK Y Bar ESE AN E SURG Recall = TP TEN (13) 
值 , 验证 集 损失 越 小 , 则 星系 形态 分 类 模型 的 分 类 
效果 越 好 , Hop, tJ 代表 验证 集 真实 的 第 i 个 星系 aa ae nes = " 
图 像 是 ;类 的 概率 ,  RNREMURA Ree PEE d 
被 预测 为 7 类 的 概率 . { ; 精确 率 和 A 率 对 F1 值 的 贡献 是 相等 的 ， 表达 
式 为 : 
ValidationLoss = -5 5 ti lg(p). (9) 
2Precisi Recall 
混淆 矩阵 如 表 3 所 示 是 对 分 类 问题 预测 结果 PI- SR: (1 
的 总 结 , 用 于 比较 分 类 结果 和 实际 测试 值 , 结果 
E428, 分 别 为 TP (True Positive), FN (False Neg- ron 
ative). FP (False Positive) TN (True Negative). 5 ”实验 结果 与 分 析 
ad rm de TE 的 样本 占 总 样本 个 数 的 5.1 ”训练 集 与 验证 集 实验 结果 
tk =. T RE 
tir MEW 集 与 验证 集 上 的 准确 率 曲线 m 中 可 知 
二 多 过 ， “(11) ”在 模型 初期 的 迭代 训练 中 准确 率 会 出 现 剧烈 波动 ， 
ee mee Ren 这 是 由 于 星系 数据 集 较 大 , 在 训练 初期 梯度 下 降 可 


能 会 落 入 非 最 优 解 的 局 部 最 小 值 , 在 约 20 个 周期 后 


表 3 混淆 矩阵 模型 逐步 收敛 , 训练 集 准确 率 与 验证 集 准 确 率 均 趋 
Tables Contusion matrix 于 稳定 , 训练 集 准确 率 最 优 达到 100%, 验证 集 准确 
Confusion Matrix Pee 率 最 优 达 到 99.39%. 
Class=Yes Class=No 图 7 为 基于 SE- Inception-v3 的 星系 形态 分 类 模 
Actual Class TB EN 型 在 训练 集 与 验证 集 上 的 损失 函数 曲线 . 在 模型 训 
Class=No FP TN 练 初期 , 由 于 模型 处 于 欠 拟 合 状态 , 验证 集 损失 较 
高, 随 着 迭代 次 数 的 增加 , 训练 集 损失 不 断 下 降 , 验 
精确 率 指 模型 预测 为 正 的 样本 中 实际 也 为 正 。 ”证 集 损失 偶尔 出 现 波动 , 在 约 20 个 周期 后 , 训练 集 


的 样本 占 被 预测 为 正 的 样本 的 比例 , 它 体现 了 模型 


与 验证 集 的 参数 基本 收敛 , 交叉 糯 损 失 趋 于 稳定 


65 卷 天 
T T T T T T T T T T 
1.0 上 ==> = — 
"mme 7 
' 

0.8 上 ' 
» 0.6 上 
o 
g 
= 
9 oak 
2 o 

02r Training Accuracy 

---- Validation Accuracy 
0.0 - 
L L L L 1 L 1 L 1 
-20 0 20 40 60 80 100 120 140 160 
Epochs 

图 6 基于 SE-Inception-v3 的 星系 形态 分 类 模型 准确 率 

Fig.6 Accuracy of galaxy morphology classification model 


based on SE-Inception-v3 


Training Loss 

10 ---- Validation Loss 

BE 
or 
$ 
d 

4b 

2 

or 

L L L L 1 L 1 L 1 L 
-20 0 20 40 60 80 100 120 140 160 
Epochs 
417 4&TSE-Inception-v3lf] E JE ds 4r 2S E78 RR 


Fig.7 Cross entropy 


loss of galaxy classification model 
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5.2 

本 文 对 在 SDSS 
tion-v3 的 星系 形态 
试 集 共 包含 3000 张 
1)、 圆 形 星系 (Class 


A 


EI 
ni 


分 类 模型 进行 了 测试 
三 | 


测试 集 实验 结果 


数据 集 上 训练 好 的 SE-Incep- 
集 检测 . 测 
系 图 片 , 其 中 旋涡 星系 (Class 


2)、 中 间 星 系 (Class 3)、 雪 茄 


H 
FE 


态 分 


P 


状 


A 
j 


fr, 


系 (Class 4) 与 侧 
类 模型 在 测试 集 上 的 混 清和 甸 
SE-Inception-v3 星 系 形 


向 星系 (Class 5) 各 600 张 , 星系 
阵 如 图 8 所 示 . 
态 分 类 模型 在 测试 集 
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验 结果 如 表 4 所 示 . 测试 集中 星系 整体 准确 率 为 


三 | 
A 


99.3796; 5 类 星系 的 精确 率 均 在 99.00% 以 上 , 说明 
该 星系 形态 分 类 模型 对 负 样 本 的 区 分 能 力 极 强 ; 
5 类 星系 的 召回 率 均 在 99.17% 以 上 , 体现 了 该 模型 
对 正 样本 具有 高 效 的 识别 能 力 ; F118351E99.1696 0 

, 表明 该 模型 具 


有 极 强 的 稳定 性 . 


AY 


SEAN 


Confusion Matrix 
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图 8 星系 形态 分 类 测试 集 混淆 矩阵 


Fig.8 Confusion matrix for galaxy morphology classification 


on testing dataset 


5.3 ”学 习 率 合理 性 验证 

为 检验 SE-Inception-v3 星 系 形态 分 类 模型 中 
的 学 习 率 选择 的 合理 性 , 本 文 进行 了 不 同学 习 率 的 
对 比 实验 , 在 保证 模型 训练 时 除 学 习 率 外 其 余 各 
参数 不 变 的 前 提 下 , 进行 了 学 习 率 分 别 为 0.1、0.01 
与 0.001 的 对 比 实验 . 实验 结果 如 图 9 所 示 , 随 着 学 
习 率 的 不 断 减 小 , 模型 收敛 速度 也 不 断 减 小 , 当 学 
习 率 为 0.1 时 模型 收敛 速度 较 快 , 但 是 振荡 剧烈 , BE 
型 稳定 性 较 差 . 当 学 习 率 为 0.001 时 , 收敛 速度 较 慢 ， 
由 于 参数 更 新 过 慢 , 模型 在 经 过 20 个 周期 训练 进 
入 收 化 状态 后 依然 有 明显 振荡 . 而 学 习 率 为 0.01 时 ， 
既 保 证 了 模型 的 收敛 速度 与 稳定 性 又 达到 了 极 高 
的 准确 率 且 不 容易 发 生 过 拟 合 现 象 , 该 实验 结果 


^. 
fH NW. 
证 了 本 文选 择 的 0.01 学 习 率 的 合理 性 . 
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表 4 基于 SE-Inception-v3 星 系 形态 分 类 模型 的 测试 集 实验 
结果 
Table 4 The results of SE-Inception-v3 galaxy 


morphology classification model on testing 


dataset 
Accuracy=99.37% Precision Recall F1 score 
Spiral 99.3396 99.33% 99.3396 
bd 99.67% — 99.5096 99.58% 
In-between smooth 99.17% 99.50% 99.33% 
Cigar-shaped smooth 99.66% 99.17% 99.41% 
Edge-on 99.00% 99.33% 99.16% 


5.4 不同 模 型 对 比 与 分 析 

为 验证 基于 SE-Inception-v3 的 星系 形态 分 类 
模型 的 优良 性 能 , 本 文 将 SE-Inception-v3 星 系 形态 
分 类 模型 与 Inception-v3 星 系 形 态 模 型 进行 比 对 ， 


4 种 神经 网 络 的 星系 形态 分 类 模型 在 验证 集 
上 的 准确 率 对 比 情况 如 图 10 所 示 . 由 图 可 知 Mo- 
bileNet (Mobile Neural Network) 网 络 模型 振荡 小 
但 收敛 速度 较 慢 , 它 是 一 个 轻 量 级 的 卷 积 神经 
网 络 , 该 网 络 进行 卷 积 的 参数 比 标准 卷 积 要 少 
很 多 , 因此 在 收敛 速度 上 相对 较 慢 . MobileNet 使 
用 DW (Depth-wise) 卷 积 提 取 特 征 , DW 和 标准 卷 
只 不 同 , 标准 卷 积 的 卷 积 核 是 用 在 所 有 的 输入 通 
id b, 而 DW 针对 每 个 输入 通道 采用 不 同 的 卷 积 
核 , 一 个 卷 积 核对 应 一 个 输入 通道 , 因此 该 模型 
在 训练 过 程 中 不 易 产 生 振 荡 . ResNet 网 络 引 入 了 
残 差 结构 , 残 差 结构 的 引入 增加 了 神经 网 络 的 深 
FE, 网 络 越 深 , 模型 获取 的 信息 越 多 , 提取 的 特 
征 就 会 越 丰富 , 因此 在 收敛 速度 上 会 优 于 Mobile- 
Net. SE-Inception-v3 星 系 形态 分 类 模型 在 准确 率 
与 稳定 性 方面 显著 优 于 Inception-v3 模 型 . SE-In- 
ception-v3 增 大 了 神经 网 络 的 感受 视野 , 运用 不 同 
类 型 卷 积 核对 张 量 进行 运算 , 从 星系 图 像 中 提取 大 


同时 还 采用 相同 的 数据 集 将 该 模型 与 广泛 应 用 于 
目标 检测 、 目 标 分 类 、 人 脸 识 别 等 领域 的 Mobile- 


Net 模 型 和 ResNet 模 型 进行 对 比分 析 . 


Accuracy 


量 有 效 特征 , 并 在 参数 更 新 过 程 中 引入 批 归 一 化 ， 
减少 了 梯度 消失 对 训练 过 程 的 影响 , 使 得 星系 分 类 
性 能 大 幅度 提高 . 


learning rate 0.1 
learning rate 0.01 
learning rate 0.001 


Epochs 
9 ”SE-Inception-v3 星 系 形态 分 类 模型 不 同学 习 率 的 验证 集 准确 率 对 比 


Fig.9 Validation accuracy comparison of SE-Inception-v3 galaxy morphology classification models with different learning rates 
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Accuracy 


图 10 4 种 星系 形态 


— — SE-Inception-v3 
Inception-v3 


— — MobileNet 
Resnet 
60 80 100 120 140 
Epochs 
分 类 模型 验证 集 准 确 率 对 比 


Fig.10 Contrast of 4 kinds of galaxy morphology classification models on validation dataset 


表 5 为 SE-Inception-v3 模 型 与 Inception-v3 模 
型 、MobileNet 模 型 和 ResNet 模 型 的 性 能 比较 . SE- 
Inception-v3 模 型 验证 集 最 优 准 确 率 达 到 99.27%， 
远 高 于 其 他 3 个 网 络 . SE-Inception-v3、Inception- 
v3、MobileNet 与 ResNet 网 络 模型 验证 集 准 确 率 
达到 85% 时 所 对 应 的 训练 周期 分 别 为 16、21、 
454529, 对 应 消耗 的 时 长 分 别 为 2.72 h、3.09 h, 
5.18 hj4.82 h. 由 此 可 见 SE-Inception-v3 模 型 在 收 
敛 速度 和 运算 时 间 方 面 都 显著 优 于 Inception-v3、 
MobileNet 与 ResNet 模 型 , 充分 验证 了 本 文 提出 的 
基于 SE-Inception-v3 神 经 网 络 的 星系 形态 分 类 模 
型 的 高 性 能 


表 5 4 种 星系 形态 分 类 模型 在 验证 集 上 的 性 能 比较 


N 


6 结语 

天 文 望 远 镜 与 天 文 观 测 技术 的 不 断 进 步 推 动 
了 海量 星系 数据 的 产生 , 针对 传统 星系 形态 分 类 模 
型 特征 选择 困难 、 分 类 速度 和 准确 率 受 限 等 问题 ， 
本 文 提 出 了 一 种 融合 SE 通道 注意 力 机 制 的 Incep- 
tion-v3 星 系 形态 分 类 模型 . 针对 图 像 背景 噪音 等 
无 关 信 息 对 星系 形态 识别 的 干扰 问题 , 在 模型 中 
引入 SE 通道 注意 力 模 块 增强 有 用 特征 通道 权重 ， 
降低 无 关 特 征 通道 对 神经 网 络 性 能 的 影响 . 将 In- 
ception-v3 神 经 网 络 与 SE 通道 注意 力 机 制 相 融合 ， 
能 够 较 好 地 平衡 精度 与 抗 噪 性 , SE-Inception-v3 模 
型 宽度 与 深度 的 优良 设计 在 避免 特征 表示 瓶颈 的 
同时 又 最 大 化 了 网 络 性 能 , 高 效 地 实现 了 自动 化 星 


Table 5 Performance contrast of 4 kinds of 系 形态 的 分 类 识别 . 通过 对 SDSS 星 系数 据 集 进 行 
galaxy classification models on validation dataset 实验 验 证 ， 最 终 在 测试 集 上 的 星系 分 类 准确 率 高 
ae E 达 99.37%, 旋涡 星系 、 圆 形 星 系 、 中 间 星 系 、 雪 匣 
CNN mode) OPHMA! g5% nk 状 星 系 与 侧 向 星系 5 种 星系 分 类 F1 值 均 在 99.16% 以 
A pO ARANAS E. 本 文 模型 与 Inception-v3、MobileNet、ResNet 
E 等 模型 相 比 具有 更 快 的 收敛 速度 和 更 高 的 准确 率 . 
a 该 模型 弥补 了 现 有 模型 在 分 类 精度 和 效率 的 不 足 ， 
Inception-v3 93.99% 21 3.09 可 为 星系 形态 分 类 提供 有 力 支 撑 . 
MobileNet 90.46% 45 5.18 
ResNet 93.22% 29 4.82 
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Galaxy Morphology Classification Model Based on 
SE-Inception-v3 


KONG Xi-yang!?? DOU Jiang-pei!? 
(1 National Astronomical Observatories/Nanjing Institute of Astronomical Optics & Technology, Chinese Academy of 
Sciences, Nanjing 210042) 
(2 CAS Key Laboratory of Astronomical Optics & Technology, Nanjing Institute of Astronomical Optics & Technology, 
Nanjing 210042) 
(3 University of Chinese Academy of Sciences, Beijing 100049) 


ABsTRAcT With the rapid development of astronomical detection technology, there will be a huge torrent 
of incoming galaxy images in the coming years, making the automatic galaxy morphology classification a 
challenging task. To solve the problem of feature selection, the low speed and low accuracy of traditional 
galaxy morphology classification models, a galaxy morphology classification model based on Inception-v3 
neural network with SE (Squeeze and Excitation Network) channel attention mechanism is introduced. 
We select galaxy images from Sloan Digital Sky Survey (SDSS) for the SE-Inception-v3 model. The test 
results show that the accuracy of SE-Inception-v3 model is as high as 99.3796, and the F1 scores of 
spiral galaxy, completely round smooth galaxy, in-between smooth galaxy, cigar-shaped smooth galaxy 
and edge-on galaxy are 99.3396, 99.5896, 99.3396, 99.4196 and 99.1696, respectively. Compared with the 
MobileNet (Mobile Neural Network) and ResNet (Residual Neural Network) models, the width and depth 
advantages of SE-Inception-v3 make the classification model have stronger feature extraction capabilities, 
which provides a new galaxy morphology classification approach for future large-scale sky survey programs. 


Key words galaxies: general, methods: data analysis, techniques: image processing 
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